Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně
9.2.2008, Milan Šurkala, aktualita
Procesor IBM Cell (Cell Broadband Engine) bude již brzo znovu inovován. Na konferenci IEEE International Solid-state Circuits Conference (ISSCC), která se konala 3. až 7. února 2008 v San Franciscu se společnosti IBM, Sony a Toshiba vyjádřily,...
jackie.cz | 11.2.200923:13
p4 75nm mamrdi!
Odpovědět0  0
ElectricKota (29) | 9.2.20088:35
Docela by mně zajímalo jaký je výkon v Tflopech, abych měl představu jak na tom jsou dnešní cpu­(x86­) a gpu.
Odpovědět0  0
V3N3C3D | 9.2.200810:02
Tohle urcite prekona x86 a to o hodne. x86 podle me sou zastaraly a nemajií tu uz co delat, ale pokud tu budou porad firmy jako Intel z části i AMD a Microsoft tak budem pořád mít x86 ikdyž je to na nic. No jo kdyby Intel měl dělat tuhle architekturu tak by mel rychle konkurenci vetsi nez je AMD a to samy plati o MS ten nemá ani jeden system na tuhle archtekturu a Linux by mu ryche vytrel zrak. A grafiky to asi taky prekonava ve vypoctu na plavouci des. carku. Nekde jsem cetl 2TFLOPS, ale nevim bylo tam víc procesoru.
Odpovědět0  0
Jafpu | 9.2.200810:40
Nejsem v tomhle oboru zrovna moc fundovaný, a řeči o tom jak je x86 architektura zastaralá a Cell geniální kus křemíku, který předběhl dobu o 10 let, slýchávám dost často. Nicméně stále si mi zdá, že to jsou z větší části jen nepravdivé spekulace zakládající se hlavně na neuvěřitelném hype a reklamní masáži Sony a IBM. Podle uznávaných benchmarků pro servery ­(Linpack, Spec, atd...­) si x86 architektura vede více než dobře. Přechod Apple od IBM procesorů na tu špinavou a zastaralou x86 architektura přinesl slušné navýšení výkonu. I ten Cell ­- podle toho co jsem slyšel ­- není zrovna dvakrát univerzální a extrémně vysoké výkony v určitých aplikacích střídá s výkony velice průměrnými, ne­-li žalostnými.
Pokud jde o ty dva TFlops, tak tady si jsem naprosto jistý ­(první odstavec jen laicky spekuluji­) že se mýlíš. 2GFlops je výkon celé PS3 ­(cell + grafika­). Samotný Cell má teoreticky maximální výkon ­(v praxi bývá pochopitelně několikrát nižší ­- záleží na aplikaci­) 218 GFlops ­(Cell na 3.2 GHz se 7 SPE­). Dnešní x86 CPU mají zhruba necelých 100 GFlops, ale v žade úloh budou asi efektivnější. Čistě ve výpočtu grafiky se Cell s dnešními GPU nemůže srovnávat ani omylem. Nejden že má teoreticky asi 2 až 4 nižší výkon v Flops ­(používá se na shadery­), ale nedisponuje asi texturovacími a filtrovacími jednotkami, které by musel extrémně pomalu simulovat právě pomocí svého ­"Flops výkonu­".
Odpovědět0  0
Grovik (54) | 9.2.200811:49
Tady pletete hrusky jabka dohromady.
1. CELL neni CPU zrovna vhodny do pocitace.
2. Apple pouzival PowerPC archytekturu kterou nakonec pomahal zakladat, ta je skutecne vykonejsi nez X86 presto Apple presel na X86 hadejte proc? Je to cena a dodavky. Intelu jsou mraky a PowerPC zase tolik neni a proto jsou o neco drazsi. Navic a to je pro Apple ted velka vyhoda i kdyz to neprizna, si MacOS X muze kazdy Franta pustit na svem PC a tim ma sanci prilakat dalsi zajemce o opravdovy Apple.
3. Navrhem jsou skutecne tyto RISC Procesory daleko pre Intelem. Nezapomente na Motorolu ktera se tohoto vyvoje take ucastni a rovnou vam muzu rici ze jejich navrhy byvaji velice dobre.
4. To co zminujete na konci je samozrejme jakasi strelba cisel. Ovsem zase CELL a X86 nelze takto porovnavat. Ale uvedu priklad:
PowerPC G4 ­- pokud zapnu Altivac ­(neco jako MMX­) vykon vzroste priblizne 2­-4x u aplikaci, ktere ho vyuzivaji. Pokud to same udelam u Intelu tedy zacnu pouzivat napriklad MMX je narust vykonu ani ne dvojnasobny.
RISC procesory jsou proste citlive na spravny kod.
CELL je pomerne jednoucelovy procesor, ale IBM jde timhle smerem pomerne dobre, protoze ve vysledku lze poznatky aplikovat i na klasicke CPU typu PowerPC.
Odpovědět0  0
Jafpu | 9.2.200812:39
ad 1­) To opravdu asi není
ad 2­) Ano, Intel má mnohem větší výrovní kapacity a i cena jeho procesorů je příznivá. Jak mi ale vysvětlíte benchmarky z té doby, které rozhodně nevypovídali o skutečnosti, že je PowerPC architektura před x86? Pokud si pamatuji, ve většině testů vítězilo Core Duo ­(které je asi o 30% pomalejší než dnešní Core 2­) nad PowerPC a to prý plno testů běželo na software optimalizovaném právě pro PowerPC.
ad 3­) Nerozumím architektuře procesorů, ale jak mi vysvětlíte benchmarky? Nechce se mi teď dlouze prohledávat internet, ale po jednoduchém dotazu do google mi jak první benchmark vypadlo tohle ­( http:­/­/www.macworld.com­/article­/54048­/2006­/11­/bench.html ­). Core 2 Duo sice beží na výšší frekvenci a nevím jak moc je stará architektura G4 ­(snad už má IBM něco novějšího­), ale i přesto se mi zdá jako vítěz Intel.
ad 4­) Nevím jak přesně myslíte to ­"například MMX­", ale tyto instrukce jsou už dost zastaralé a v x86 jsou v podstatě jen kvůli zpětné kompatibilitě. Také jsem často slýchával, že SIMD instrukce v x86 nesahají Alivetecu ani po kotníky, ale poslední dobou jsem několikrát zaslech, že od té doby co má Intel SIMD instrukce 128 bitové ­(dříve 64 bitové­) a disponuje instrukcemi SSSE3 a novějším, se karta v této oblasti trochu obrací. Nevím, neorientuji se v tom, ale stále si mi zdá, že na to jak všichni na x68 architekturu plivají a tvrdí že je Intel 100 let za IBM, podávají nové x86 procesory moc dobré výkony.
Navíc pokud se nepletu, tak x86 je prý v podstatě také RISC architektura, která pouze interně překládá instrukce do CISC a navenek se tedy jako CISC jen tváří.
Odpovědět0  0
nador (6) | 13.2.200819:13
Pane Jafpu:
ad ad 3­) podival jsem se na Vami uvadeny test a musim se smat. Jednak se podivejte na frekvence tech procesoru. Na stejne frekvenci by uz ten procesor zdaleka nemel tak spatny vysledek. Ale hlavne si uvedomte, ze G4 vysel v dobe pred Core od intelu a tudiz mu nemuze tolik konkurovat ­(ale presto mu v leccems konkuruje­). Ten procesor se zcela spravne nazyva PowerPC, coz znamena zhruba Silny osobni pocitac. To je presne to co tato architektura vystihuje, je to architektura pro silne osobni pocitace, mohli jsme to v minulosti videt mnohokrat, kdyz PC byla jeste kancelarska kalkulacka, PowerPc kraloval v hrach i multimediich, viz. Macintosh, ale treba i takova Amiga s 512kB pameti a procesory Motorola 68000 ­(jeden z predchudcu PowerPC­). Vite na kolik MHz tento procesor bezel? 7.09379 MHz. Prijde Vam to malo? Ano, je to malo, ale bezela na tom Dune2 nebo Settlers 1 ci Ufo: Enemy Unknown, a to daleko lepe nez na tehdejsich 486 s 16MHz a 4 a vice MB pameti !!! A tento naskok si tento procesor udrzel vzdy !!! A to i dnes, viz napriklad architekturu POWER5, na tu proste Vas oblibeny Core ani Core2Duo nema. Proste architektura x86 na PowerPC nikdy nemela ani vykonem a uz tuplem ne spotrebou. A jeste Vam k tomu reknu, ze kdyby se davaly do PS3 procesory Core, tak by je pravdepodobne Cell pokoril, protoze ten je na takovou praci daleko lip optimalizovan.
ad ad 4­) Vezte, ze oni zminovani vsichni maji pravdu a architektura X86 je sto let pozadu. Jeste ze tu je alespon AMD, ktere se ji snazi tlacit dopredu. Jinak byste mel dnes doma 486 na 550MHz. Bylo to AMD, ktere koupilo sbernici Alpha EV6 a bylo to AMD, ktere uvolnilo zpetne kompatibilni procesor s 64bitovou instrukcni sadou, bylo to AMD, ktere s Athlonem posunulo tehdejsi architekturu x86 od kalkulacky ­(intel Pentium II­/III­) k multimedialnimu procesoru a bylo to AMD ktere nikdy nevydalo tak strasny zmetek jako je procesor Pentium 4 :­-­). Ale zpet k PowerPC: a to se jiz dostavam k Vasemu zaveru. Nevim jak to je u intelu, ale tu vec, kterou Vy popisujete, ze x86 je Risc architektura prekladana z CISC, tak v te mate asi vyjimecne pravdu. Jenze tento pristup k instrukcim zavedla prave firma AMD se svymi K5, coz se ukazalo jako dobry tah, protoze to zrychlilo vypocty, a to i presto, ze nejaky cas trva preklad techto instrukci. Tzn, ze bod ma zase PowerPc architektura, ktery tento cas na preklad nepotrebuje, ze? Jestli Intel uz konecne presel na tento model a zajistil si tak vetsi vykon nez CISC reseni, to opravdu nevim a je mi to srdecne jedno, protoze pouzivam pouze pokrokovou techniku AMD, ale co je jiste je, ze pokud by byl v Cechach v nabidce stroj s PowerPC ­(napr Efika s 400MHz a vykonem jako pentium III na 1000Mhz a spotrebou do 20W­), tak nevaham ani minutu a jdu do nej ! A jeste jedna vec je jista: Apple udelal moooc moooc velkou chybu s prechodem na intel. Prisel o mnoho vykonu a stability. Jedine dobre z toho plynouci je portovani dalsiho BSD na x86 a nepatrne zlevneni jeho pocitacu, z kterych se razem stalo predrazene PC.
A jeste jedna vec: nejlepsi je stejne opensource procesor od sunu, UltraSPARC, viz http:­/­/en.wikipedia.org­/wiki­/OpenSPARC :­-­) .
Odpovědět0  0
Milan Šurkala (4982) | 9.2.200822:52
Bohužel jsem v Altivecu nepracoval ­(ačkoli jsem původně měl­), ale ono ani to MMX, či teda spíše SSE není nejhorší. Ovšem velmi silně záleží na kódu. Přepracovával jsem funkce pro segmentaci obrazu z C++ do C++ s SSE a dosáhl jsem sotva 5­-15% zrychlení ­(5% na AMD K8, přes 15% na Intel P4­). Stejně tak jsem přepracovával velmi triviální funkci na zesvětlení obrazu pomocí MMX a dosáhl jsem 15x násobného zrychlení ­(z 0,075ms na 0,005ms­), což mě dost překvapilo, zvláště když můžu zpracovávat maximálně osm pixelů najednou. Holt ale použitá instrukce byla natolik inteligentní, že mi pomohla zastoupit klasické tři příkazy najednou. Záleží také na tom, co se urychluje. Někdy bych si Altivec chtěl zkusit, ale můžu říct, že SSE je od své druhé verze už velmi dobře použitelné.
Odpovědět0  0
xR- | 10.2.200813:32
Pracuji jak s AltiVec, tak s SSE­/SSE2­/SSE3­/SSSE3­/SSSE4.1 a myslim, ze SSE se s kazdou dalsi verzi zlepsuje. AltiVec ma vyhodu ve vetsi kompletnosti, jednoduchosti a promyslenosti. Na druhou stranu ma nedostatky ve slozite praci s pameti a provazanosti se zbytkem CPU. Taky nepodporuje double­-precision floaty. SSE je trochu chaos, ale s kazdou dalsi verzi pribyvaji uzitecne instrukce a ma lepsi zacleneni do CPU ­(vlastne sdili vypocetni jednotky, adresovaci mody, atp.­). Pokud si programator rucne vyhraje s SSE kodem v assembleru, tak neni problem doshanout obrovskych zrychleni oproti C++ kodu ­(bezne tak 5x, nekdy az 20x­). SSE5 od AMD uz prinese posledni vyhody AltiVecu ­(3 operandy, MAD, PERM­) do SSE, takze uz nebude co resit...
Odpovědět0  0
potoo | 9.2.200814:47
Ten vykon nebude az tak zazracny. Ciste teoreticky vykon Cellu v PS3, kde ma vypnutou jednu SPE jednotku je 218Gflops. Cili na 6GHz se pri plnem poctu SPE jednotek da pocitat s vykonem kolem 400Gflops ciste v teoreticke rovine. Pokud se totiz podivas na vykon, jaky Cell predvadi naprilad v projektu Folding@home, tak na jeden Cell pripada prumerny vykon pouze 15Gflops, zatimco GPU z rodiny jeste X19XX podavaji v prumeru 75Gflops. Pricemz u Cellu se jedna ve vsech pripadech o stejne procesory, zatimco v tom prumeru u grafik jsou zapocteny i grafiky s orezanymi jadry jako X1950Pro nebo X1650XT, cili jedna se i o slabsi karty.
Cell ma vyborny vykon v ciste teoreticke rovine, ale v praxi je to o dost horsi. V tomhle ohledu jsou x86 procesory sice slabsi co se tyka toho teoretickeho maxima, v praxi ale podavaji mnohdy lepsi vysledky. Myslim, ze nejlepsi srovnani prijde ve chvili, kdy se objevi osmijadra Intelu. Ta myslim Cell bez problemu prekonaji i na nizsi frekvenci. Teoreticky vykon u soucasnych Xeonu­(ctyrjadro­) 3GHz v kombinaci s FB­-DIMM pametmi se udava kolem 104Gflops. U osmijadra by to bylo kolem 208Gflops a pri stejne frekvenci jako ma Cell by to bylo prakticky srovnatelne. Nove jadro Penryn pak vykon posouva o nejakych 5­-10% vyse a Nehalem by mel byt opet o neco rychlejsi. Cili rozhodne bych netvrdil, ze x86 architektura je na tom spatne. V poslednich trech letech naopak doslo k vyraznemu narustu vykonu smerem nahoru.
Odpovědět0  0
liborc (398) | 12.2.20090:36
Výkon neroste lineárně s počtem jader. A ve Windows už vůbec ne. Nevím, jak teď, ale mívaly docela nechutnou režii na plánování, kolem 20 %. Takže nárůst dualCPU oproti singleCPU mašině byl jen 80%. Třeba Sun­/UltraSPARC měl nárůst 99%.

Další faktor je do kolika procesorů­/jader danej OS škáluje. Tedy, odkdy je nárůst režie takový, že se další procesory­/jádra nevyplatí přidávat...
Odpovědět0  0
l.jelinek | 10.2.200818:28
Sorry, ale ty naplno vyuzijes soucasne dual­-core nebo quad­-core procesory? Nehlede na cenu ­- sice to na cene PS3 neni videt, ale nemelo by se zapominat, ze Sony stale PS3 dotuje!!
Odpovědět0  0
ElectricKota (29) | 10.2.200819:31
Ano opravdu využiju, hry hraju jen rekreačně. Čím víc jader­/CPUs tím líp.
Odpovědět0  0
liborc (398) | 11.2.200813:05
Mam dojem, ze dnesni x86 architektura je v zasade Digital Alpha s x86 API. Vzdyt i sbernici pouziva EV6 ci 7...
Odpovědět0  0
nador (6) | 13.2.200820:15
Microsoft ma pro architekturu PowerPC system Windows NT 3.51 a NT 4.0 ... Teda ne ze by to byla nejaka pecka, ale jenom tak pro upresneni.
Odpovědět0  0
Zajímá Vás tato diskuze? Začněte ji sledovat a když přibude nový komentář, pošleme Vám e-mail.
 
Nový komentář k článku
Pro přidání komentáře se přihlaste (vpravo nahoře). Pokud nemáte profil, zaregistrujte se pro využívání dalších funkcí.